RDLY
.ru
Тренды
Статьи
Темы
Люди
Мариус Хобхан
4 статьи
3ч 06м
🤖 Искусство обмана: почему ИИ начнет скрывать свои цели
80,000 Hours · 03.12.25 · 9,4 тыс. просм.
2ч 10м
🎭 ИИ научился обманывать: как модели саботируют тесты безопасности
The Cognitive Revolution · 18.09.25 · 128 тыс. просм.
2ч 10м
🕵 Стратегический обман: как ИИ учится манипулировать разработчиками
The Cognitive Revolution · 18.09.25 · 128 тыс. просм.
1ч 57м
🕵 Как глава Apollo Research проверял GPT-4 на склонность к обману
The Cognitive Revolution · 16.12.23 · 1,7 тыс. просм.